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基于 超 像素 统计 量 的 随机 森林 遥感 图 像 分 类 


AKR BIRA DES E? 


(1. 北京 林业 大 学 信息 学 院 ,北京 100083;2. 北京 建筑 大 学 测绘 与 城市 空间 信息 学 院 ,， 北京 100044) 


要 : 针对 路 感 图 像 地 物 和 覆盖 分 类 方法 对 图 像 空 间 分 布 信息 利用 不 足 的 问题 ， 提 出 一 种 基于 超 像素 统计 量 的 随机 森 
林 跟 感 图 像 分 类 方法 。 以 北京 市 海淀 区 为 研究 区 , 选用 Landsat-8 卫星 为 主要 数据 源 , 通过 改进 SLIC 超 像素 分 割 方法 ， 
使 之 适用 于 多 光谱 落 感 图 像 中 超 像 率 的 分 割 ， 提 取 超 像素 常见 的 六 个 统计 量 (最 小 值 、 最 大 值 、 均 值 、 标 准 差 、 上 四 分 
位 数 、 下 四 分 位 数 ) 用 于 随机 森林 在 遥感 图 像 中 的 分 类 。 实 验 结果 表明 ， 本 文 对 研究 区 冰 感 图 像 的 总 体 分 类 精度 为 
89.01%， 明 显 改 善 了 对 地 物 的 错 分 和 漏 分 现象 ， 能 够 推广 到 Landsat-8 é && [42 492645 & 2 X Tp. 
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Research on random forest remote sensing image classification based on superpixel statistics 


Shi Caixia!, Zhao Chuangang!, Pang Lei? 
(1. School of Information Science & Technology, Beijing Forestry University, Beijing 100083, China; 2. School of Geometrics 
& Urban Information, Beijing University of Civil Engineering & Architecture, Beijing 100044, China) 


Abstract: In order to solve the problem of insufficient utilization of the spatial distribution information in remote sensing image 


classification, this paper proposed a random forest remote sensing image classification method based on superpixel statistics. 
Taking Haidian district, Beijing as study area and Landsat-8 OLI (Operational Land Imager) image as the main data source, the 


author utilized six statistics(maximum, minimum, mean, standard deviation, upper quartile, lower quartile) calculated by 


superpixel segmentation algorithm as features to build remote sensing image classification model based on Random Forest. The 
experiments show that superpixel statistical features can significantly improve the overall classification accuracy of remote 
sensing image to 89.0196, and effectively reduce omission error and commission error. This method can be extended to land 
cover classification from Landsat-8 remote sensing image. 
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习 。 超 像素 分 割 方法 分 为 两 类 ， 一 类 是 基于 图 论 的 方法 : NC 

(normalized cuts )!6, GSC graph based )U!, SL(superpixel lattice ) 

遥感 信息 提取 的 关键 技术 之 一 就 是 遥感 图 像 分 类 。 过 去 的 I， 另 一 类 是 基于 梯度 下 降 的 方法 : WS Cwatersheds) P, MS 

几 十 年 里 ， 国 内 外 专家 和 学 者 一 直 致 力 于 提高 遥感 图 像 分 类 精 (Mean-Shift) 00、QS (quick shift) H1, TP (Turbopixels) U?1, 
度 .遥感 图 像 分 类 主要 分 为 基于 像素 的 分 类 和 基于 对 象 的 分 类 。 SLIC (simple linear iterative clustering) [3 等 。 其 中 SLIC 算法 
基于 像素 的 分 类 方法 以 像素 为 基本 处 理 单元 ， 忽 视 了 图 像 中 邻 相 比 于 其 他 算法 ， 有 具有 分 割 速度 快 、 计 算 复杂 度 低 、 超 像素 边 
近 像 素 间 的 空间 分 布 关 系 ， 限 制 了 分 类 精度 的 提高 。 基 于 对 象 ” 缘 贴 合 度 和 紧密 度 较 好 、 生 成 超 像 素数 量 可 控制 的 优点 。 现 已 


D 


T 


的 分 类 方法 充分 利用 了 图 像 的 光谱 信息 和 空间 分 布 信息 ， 其 分 。 有 研究 将 SLIC 算法 应 用 于 遥感 图 像 的 分 割 处 理 04 13, (HAE 

类 性 能 优 于 基于 像素 的 分 类 方法 号 3。 是 针对 彩色 遥感 图 像 的 分 割 ， 而 鲜 见 于 多 光谱 遥感 图 像 的 分 割 
图 像 分 割 是 基于 对 象 分 类 方法 的 关键 步骤 之 一 ， 分 割 质 量 。 处 理 。 

的 好 坏 直接 影响 分 类 精度 B]。 超 像素 是 近年 来 快速 发 展 的 一 种 随机 森林 (random forest, RF) 算法 作为 一 种 基于 分 类 与 

图 像 分 割 方法 ， 相 较 于 以 往 的 图 像 分 割 方法 ， 更 有 利于 图 像 局 ”回归 决策 树 的 机 器 学 习 算法 09,， 在 遥感 图 像 分 类 领域 受到 国内 

部 特征 的 提取 ， 而 且 能 有 效 降 低 图 像 后 续 处 理 的 计算 复杂 度 记 外 研究 学 者 的 广泛 关注 0799。 特 征 变量 的 选择 对 RF 算法 的 分 


基金 项 目 : 建筑 学 基金 资助 项 目 〈61501019); 北京 市 教育 委员 会 科技 计划 一 般 项 目 〈SQKM201610016008) 

作者 简介 : 石 彩 霞 (1991-), 女 , 山西 吕梁 人 , 硕士 研究 生 , 主要 研究 方向 为 计算 机 应 用 、 图 像 处 理 、 机 器 学 习 sex. fighting22163.com) ; 赵 传 钢 (1971-)， 
男 ， 副 教授 ， 博 士 ， 主 要 研究 方向 为 信息 检索 、 机 器 学 习 等 ; AE 〈1971-)， 女 ， 副 教授 ， 博 士 ， 主 要 研究 方向 为 多 基线 干涉 SAR 数据 处 理 、 层 析 SAR ŚR 
技术 等 . 


201805.00183v1 


chinaXiv 


录用 稿 


类 精度 有 重要 影响 ,文献 [20] 将 光谱 、 形状 和 纹理 特征 共同 作为 
RF 算法 的 特征 变量 应 用 于 高 分 辨 率 遥 感 图 像 , 有 效 改 善 了 总 体 
分 类 精度 。 文 献 [21] 将 Getis 统计 量 作为 特征 变量 加 入 RF 分 类 
模型 中 提高 了 RF 算法 的 分 类 性 能 。 文 献 [22] 提 出 将 矩 距离 指数 
(Moment Distance Index，MDI)、 光 谱 特 征 、 地 形 特征 相 结 合 
用 于 帕 米 尔 高 原 的 植被 覆盖 分 类 。 目 前 RF 算法 中 特征 变量 的 
选择 没有 较 通 用 的 方法 用 于 各 种 类 型 的 遥感 图 像 ， 因 此 RF 分 
类 算法 在 特征 变量 的 选择 上 仍 有 很 大 的 改善 空间 。 
本 文 改进 了 SLIC 超 像素 分 割 算法 使 之 适用 于 多 光谱 遥感 
提取 超 像素 常见 的 6 个 统计 量 用 于 RF 算法 在 多 光谱 遥 
像 的 地 物 分 类 中 ， 从 而 有 效 利用 遥感 图 像 的 光谱 信息 和 空 


息 。 
AES 


N 


PS 


像 ， 
图 
5) 


间 
1 ”相关 方法 及 原理 


随机 森林 
RF 是 由 决策 树 分 类 器 {h(x,Bi),k=1,K} 组 合 的 集成 分 类 
器 , 最 终 的 分 类 结果 是 由 基 分 类 器 投票 决定 。 RF 算法 的 基本 流 


1.1 


T 
Hr 
i 

Tint 


b) 个 训练 样 
c) K 种 分 类 结果 采用 投票 表决 
RF 算法 基本 流程 如 
步骤 b) 每 棵 决策 树 的 输入 变量 


AH, 


H Bootstrap 抽样 方法 从 原始 样本 外 


等 : 基于 超 像素 统计 


本 集 分 别 构建 决策 树 模型 , 得 到 种 分 类 结果 。 


中 随机 抽取 天 个 训练 


图 1 所 示 。 


M 个 特征 。 通 


pus 


的 特征 数 
A (Entropy). 


和 信 


其 中 : 


Ho. 5, 


量 是 从 


的 方式 确定 最 终 分 类 结果 。 


N 个 特征 中 随机 


常 M 取 值 为 M=VN 或 M =log,N+1 (NN 为 总 


节点 分 裂 标准 


通常 采 


基尼 指数 (Gini) 


Si 


m 5 
Gini(D) 21- È p? 
i=l 


Entropy(D) = 


E p;log;(pi) 


种 方法 的 计算 公式 分 别 为 : 


a) 


Q) 


m 表示 训练 数据 集 D 包含 的 类 别 个 数 ，p; 表 示 训 练 数据 


属于 类 别 C 的 概率 。 


/训练 样本 

集 D1 

BARK / D unu 训练 样本 。 /决策 树 72 

集 D | 集 D2 H 

“训练 样本 / | 决策 树 7 
集 DK 

Step! Step2 

图 1 RF 


1.2 ZENEI 
1.2.1 SLIC 超 像 素 分 割 算法 
SLIC 算法 0 是 一 种 基于 梯度 下 降 的 超 像素 分 割 方法 ， 根 


据 各 像素 之 间 空 间 和 颜色 距离 的 相似 性 进行 分 割 ， 整 个 分 割 过 
程 只 需要 一 个 参数 KK 用 于 控制 生成 的 超 像素 的 数量 。 
SLIC 算法 的 基本 流程 如 下 : 


[| 


a) 初 始 化 种 子 点 。 在 像素 点 个 数 为 N 的 图 像 上 ， 按 照 步 长 
=VN/K 均匀 分 布 种 子 点 。 在 原始 种 子 点 的 3*3 邻 域内 ， 将 
梯度 值 最 小 的 像素 点 作为 新 的 种 子 点 ， 同 时 为 每 个 种 子 点 分 配 
一 个 单独 的 标签 值 。 

b) 为 每 个 像素 点 分 配 标 签 值 。 在 以 种 子 点 为 中 心 ，25 *25S 
的 搜索 范围 内 ， 计 算 该 种 子 点 与 搜索 范围 内 各 像素 点 的 距离 ， 
然后 将 与 各 像素 点 距离 最 小 的 种 子 点 的 标签 值 赋 给 对 应 的 像素 
点 。 

0) 更 新 种 子 点 。 计 算 每 个 超 像 素 块 的 坐标 重心 ， 
超 像素 块 新 的 种 子 点 的 位 置 。 


作为 


将 其 


法 基本 流程 


d) 重 复 步 又 bc)， 


6) 去 掉 多 连通 
步骤 b) 中 , 


距离 


直至 


至 结果 收敛 。 
以 及 过 小 超 像 素 。 


相似 性 的 度量 乡 


ERE 5 维 


(CIELAB 色彩 


空间 ，[1 a 5b] 和 坐标 空间 ，[x y )， 其 计算 公式 如 下 : 
qi jJ 1 (aj -a) (b; -b)? (3) 
dl, = JGj-x Q7» (4) 
j 2 jj 2 
D! = (d$ + (5) 
m S 
其 中 : d 为 像素 点 间 的 颜色 差异 , 表示 像素 i 和 像素 J 在 色彩 空 


HU a b 的 距离 ，d 为 像素 点 间 的 空 
的 间距 ，m 为 常数 ， 用 来 衡量 颜色 相似 性 和 空 
D 为 两 个 像素 的 


计算 中 


的 相对 重要 性 ; 


值 越 小 ， 说 明 两 个 像素 越 相似 。 


间距 离 ，5 为 种 子 点 
x 间 邻 近 性 在 距离 
距离 ， 即 相似 度 ，D 
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1.22 改进 的 SLIC 超 像素 分 割 算 法 
原 SLIC 算法 是 针对 彩色 图 像 的 处 理 ， 而 研究 数据 为 多 光 


谱 和 遥感 图 像 〈7 个 波段 )， 将 距离 度量 的 维 


原先 5 维 扩展 为 


9 维 (色彩 空间 : 波段 17: [b by by b, by by b Ru 


此 得 到 距离 的 计算 公式 如 下 : 


标 空 间 : [x y] j; 


- 7 
d 42, byb (6) 
" j 2 dï 2 
D?! = (ooa; +E (1) 
m M 


其 中 : dba 为 像素 点 间 的 颜色 差异 ， 表 示 像 素 i 和 像素 J ER 
段 空间 的 距离 ， by 和 bi; 分别 表示 像素 i 和 像素 j 在 波段 的 
像 元 值 。 同 理 ， pi 表示 两 个 像素 的 相似 度 。 
1.2.3 超 像 素 统计 量 

利用 改进 的 SLIC 超 像素 分 割 算 法 计算 得 到 超 像素 ， 然 后 
对 遥感 图 像 中 超 像素 的 特征 进行 提取 ， 并 将 这 些 特征 作为 RF 
分 类 模型 的 分 类 特征 向 量 ， 以 达到 充分 利用 遥感 图 像 的 空间 分 


布 信息 的 目的 。 


lowerQ mean upperQ 


min max 


图 2 一 组 数据 的 统计 特征 


didDev 


本 文 从 统计 分 析 的 角度 进行 超 像素 的 特征 提取 ， 根 据 图 2 
所 示 的 箱 体 图 ,一 组 数据 的 总 体 分 布 特征 一 般 包括 6 个 统计 量 : 


ig 


最 小 值 (min)、 最 大 值 (max)、 均 值 (mean)、 上 四 分 位 数 (upperQ)、 


下 四 分 位 数 (lowerQ ) 和 标准 差 (stdtDev )。 将 这 6 个 统计 量 共 
同 作为 特征 来 描述 超 像素 的 整体 信息 。 
1.8 RF 与 超 像 素 统计 量 相 结合 的 遥感 图 像 分 类 
1.3.1 算法 描述 

本 文 将 改进 的 SLIC 超 像素 分 割 算 法 与 RF 算法 相 结 合 , 把 
超 像素 的 统计 量 特征 作为 分 类 特征 输入 到 RF 模型 中 进行 遥感 
图 像 的 地 物 分 类 。 本 文采 用 技术 路 线 如 图 3 所 示 。 
其 中 ， 主 要 处 理 步骤 为 : 


a) 先 对 Landsat8 OLI 多 光谱 遥感 图 像 进 行 预 处 理 , 包括 对 


合作 期 刊 


ChinaX 
FV TEC 


上 的 7X6=42 个 统计 特征 ， 提 取 示 意图 如 图 5 所 示 。 


步 又 纹理 


c) H, 


(mean), 


Ccontrast )、 相 异性 (dissimilarity )、 


(angular second moment), 4H 


每 个 纹 


特征 
方差 Cvariance), 


超 像素 分 割 y 


由 GLCMII t 44 8] , 
协同 性 (homogeneity )、 


包括 均值 
对 比 度 


c EJ Centropy). ZE 


E Ccorrelation). 共 八 个 特征 ， 
特征 在 Landsat-8 的 七 个 多 光谱 波段 分 别 进行 计算 。 


— Meere rer or | 


提取 


超 像 素 统计 量 


CEDE 
提取 纹理 特征 


选取 训练 样本 
和 验证 样本 


分 类 结果 


v 


分 类 精度 验证 


图 3 技术 路 线 


区 | 


1.3.2 算法 复杂 度 分 析 


本 文 主 


图 像 进 行 辐射 定 标 、 大 气 校 正 、 工 程 区 图 像 的 镶 让 与 裁剪 ， } 

b) 采 用 改进 的 SLIC 超 像素 分 割 算法 对 遥感 图 像 进行 分 割 ， 算法 中 决策 树 个 数 为 K ， 
将 特征 相似 的 在 一 定 区 域内 的 像素 点 聚 类 成 超 像 素 块 ， 对 每 个 ” 时 间 复 杂 度 为 OW) [31， 
超 像素 在 每 个 波段 上 提取 六 个 统计 量 (min, max, mean, stdDev， 为 O(KMN (log N)^) 04, 


upperQ, lowerQ) 作为 超 像素 区 域内 各 个 像素 的 统计 特征 ; 
0) 将 多 光谱 波段 数据 、 纹理 特征 与 超 像素 统计 特征 相 结合 ， 
% 同 作为 输入 变量 构建 RF 分 类 模型 ， 得 到 地 物 分 类 图 ; 
d) 将 分 类 结果 进行 分 类 精度 的 验证 。 


步骤 b) 中 ， 利 用 改进 的 SLIC 算法 进行 超 像素 分 割 ， 分 割 
如 图 4 所 示 。 对 图 像 中 的 每 一 个 超 像 素 块 提 取 7 个 多 光谱 波段 


2 实验 


2.1 


4 SLIC 超 像素 分 割 


分 类 特征 


arc 
/ 数据 


7 
/ 


要 选择 SLIC 超 像素 分 割 和 随机 森林 分 类 两 个 算法 
] 于 遥感 图 像 分 类 。 假 设 图 像 包含 的 像素 点 数 为 N ， 随 机 森林 


数 为 M ，SLIC 分 割 算 法 的 


随机 森林 分 类 算法 的 时 间 复 杂 度 近似 


2.1.1 研究 区 概况 与 分 类 系统 


本 文 以 北京 


市 海淀 区 为 看 


九 


研究 区 概况 、 分 类 系统 及 数据 源 


区 (北纬 39°53'~40°09'， 东 经 


116°03'~116°23')( 图 6)。 海 淀 区 气候 


E 
Ea 


p i Xx 


Bl 
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冬季 寒冷 ， 夏 季 
西高 东 低 ， 西 部 为 
较 高 的 地 区 覆盖 关 妈 


IL 


的 状态 ， 
泊 。 研 究 区 具有 典 
为 实验 区 域 。 


4 超 像素 统计 量 
a 超 像素 统计 量 
超 像素 统计 量 

图 


炎热 多 雨 。 全 


型 是 林地 ， 农 
区 域内 有 大 小 河流 10 条 ,还 有 玉渊潭 、 
型 的 城市 地 物 类 型 


区 面积 为 430.77 FFX, wA 
| 地， 东部 和 南部 为 平原 。 研 究 


区 西部 海拔 


| 与 分 散 的 居民 点 呈 混 合 分 布 


上 


主 水 库 等 


(min, „min, ,L „min, . 
max, ,max;, osmax,. 


mean, .mean,.L .mean,, 


特点 ， 据 此 将 本 研究 区 作 


upperQ; upperQ; „L .upperQ, . 
lowerQ, .lowerQ; ,L .lowerQ, , 
stdDev; , stdDev,. L .stdDev, } 


imin, „min, „L min, ， 
max, „max, ,L ,max,, 


mean, .mean,.L ‚mean; , 


upperQ; .upperQ; „L .upperQ, . 
lowerQ, .lowerQ, .L .lowerQ, . 
stdDev, ， stdDev.. LL .stdDev, } 


(min, min, La min; , 
max, ,max,.L ,max, , 
mean, mean, ‚L ,mean, , 


upperQ, ,upperQ, „L .upperQ, . 


lowerQ, .lowerQ, .L ‘lowerQ,, 
stdDev, .stdDev,. L .stdDev, 


地 利用 / 履 被 分 类 体系 , 结合 北京 


本 文 所 使 用 


5 超 像素 统计 量 分 析 


根据 全 国土 地 遥感 监测 利用 /覆盖 分 类 体系 和 遥感 数据 土 
市 海淀 区 的 土地 利用 现状 以 及 
遥感 数据 源 〈Landsat-8) 的 特点 ， 将 研究 区 的 地 物 


39° 5TN 


AX, 
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2.1.2 数据 源 
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的 Landsat-8 卫星 OLI 多 光谱 影像 。 石 
OLI 数据 覆盖 ， 对 原始 影像 〈 轨 道 号 为 123/032, 
) 进行 相应 的 图 像 预 处 理 
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图 像 处 理 操作 。 
本 研究 选用 


样本 和 验证 分 类 精度 的 


2.29 ”实验 过 程 
2.2.1 软件 

本 文 使 
作为 开发 语 
究 的 遥感 图 


言 ， 同 时 结 


2.2.2 样本 选择 
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pa 
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九 


进行 图 像 
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区 需要 
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2: Landsat-8 
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tr EnMAP-Box 工具 


[25] 


实现 了 对 本 文 丰 


像 分 类 方法 的 实验 验证 。 实 验 平 
里 器 、6GB 内 存 、Windows7 64 位 操作 系统 。 


结合 目 视 解 译 (图 
像 的 标准 
像 选择 训练 样本 和 建 模 


E 


段 彩色 合成 图 )， 


7， 解 译 图 像 为 Landsat 8 多 光谱 遥感 民 
Google Earth 提供 的 高 分 辩 率 影 
同时 保证 样本 在 整个 


样本 ， 


参考 


台 采 用 2.10GHz 处 


究 区 域 均 


匀 分 布 ， 样 本 选择 采 / 


GE: 训练 样本 和 验证 样本 相互 独立 )。 
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大 ,生成 的 超 像素 块 越 小 , 相同 的 地 物 类 型 


HREN K 


基于 超 像 素 提 取 图 像 的 局 部 统计 特征 ， 分 割 尺度 是 影响 统 
下 提取 的 关键 因素 。 假 设 超 像素 分 
制 的 每 个 超 像 素 的 大 小 为 N/K 。 值 越 
被 聚 类 到 同一 区 域 ， 


， 图 像 中 共 


— 


FAY 


因此 ， 
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昌 的 特点 以 及 


色 合 成 结果 。 


分 层 随机 抽样 的 方法 ， 


\ 体 情况 见 表 1 


一 定 的 范围 ， 
而 且 生 成 超 像素 的 速度 也 明显 降低 。 相 反 ， 
beads ad pM AAA Ad 
导致 从 分 割 。 
1 速度 之 间 取 得 平 


衡 。 


聚 类 到 同一 区 域 ， 


九 


a 


像 


又 图 像 的 大 小 为 
的 大 小 ， 分 别 使 


J K-10000, 30000, 50000, 70000, 90000 的 分 割 尺 度 提 取 超 
像素 统计 量 。 图 8 所 示 为 研究 区 的 局 部 区 域 在 上 述 5 种 分 割 尺 
度 下 生成 的 超 像 素 在 波段 5、4、3 上 提取 均值 特征 


得 到 的 假 彩 
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表 1 训练 样本 选择 

类 型 建 模样 本 个 数 〈 像 元 ) ”验证 样本 个 数 〔 像 元 ) 
水 体 100 286 
耕地 725 562 
林地 316 519 

建设 用 地 1179 680 
裸 地 359 338 
总 计 2679 2385 


(a) K=10000 


(b) K=30000 


(c) K=50000 


(d) K-70000 


(e) K-90000 


图 8 WEE 


尺度 下 的 超 像素 分 割 结果 局部) 


本 文 提取 的 超 像素 特 包 
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AE, Si 基于 超 像 素 统计 量 的 随机 森林 这 感 图 像 分 类 


根据 GLCM 在 7 个 多 光谱 波段 上 分 别提 


征 〈 纹 理 提取 窗口 为 Sx5$223)， 将 超 像素 特征 (7X6=42)、 纹 理 
THE 7X 895560 和 7 个 多 光谱 波段 数据 赋予 图 像 的 各 个 像素 构 


成 每 个 像素 的 特征 向 量 〈 共 105 个 )。 


为 了 进一步 说 明 分 割 尺 度 对 图 


E 为 各 超 像素 在 7 个 多 光谱 波段 的 6 
个 统计 量 (min，max，mean，stdDev，upperQ，lowerQ )， 同 时 


取 像 素 的 8 个 纹理 特 


像 分 类 结果 的 影响 ， 利 用 本 


文 提出 的 分 类 方法 对 遥感 图 像 在 上 述 5 种 超 像素 分 割 尺 度 下 进 
行 分 类 ， 从 而 选择 最 合适 的 尺度 提取 超 像 素 统 计量 ， 有 具体 说 明 
见 3.2 节 。 根 据 3.2 节 的 实验 结果 ， 本 文选 择 K—50000 作为 最 


终 的 超 像素 分 割 尺度 。 
2.2.4 RF 分 类 模型 构建 


本 文 实验 中 , RF 分 类 模型 的 参数 选择 情况 为 : 决策 树 的 个 


BON 100, 决策 树 特征 子 集 的 个 数 为 10( V105 ， 本 文 候选 特征 
数 为 105), 选择 具有 最 小 Gini 指数 的 属性 作为 分 裂 属 怕 
用 由 7 个 多 光谱 波段 数 提 


E~ SLIC 提取 到 的 


42 个 局 部 统计 特征 、 


GLCM 提取 的 56 个 纹理 特征 构造 像素 的 特征 向 量 (105 个 )， 


作为 RF 模型 的 输入 变量 。 


3 ”分 类 结果 与 精度 验证 分 析 


3.1 分 类 结果 
图 9 所 示 为 仅 使 / 


EDn 


ERI AGE 


ERE 


和 辅 以 超 像 素 统计 特征 
果 。 


E. 实验 


E 的 RF 分 类 结果 


(分 割 尺 度 为 K=50000) 的 RF 分 类 结 


(a) 仅 基于 多 光谱 特征 .纹理 


(b) 辅 以 超 像素 统计 特 和 


特征 的 RF 分 类 结果 
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人 


果 对 比 


ER RF 分 类 结果 (分 割 尺度 K=50000) 


图 9 分 类 结 
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录用 稿 BRR, F: sana DOXIVE 感 图 像 分 类 


3.2 ”精度 验证 假设 RF 中 用 棵 决策 树 ， 对 于 变量 已 ， 第 ;i 棵 决策 树 T 对 应 
图 10 为 不 同 分 割 尺度 下 提取 的 超 像素 统计 特征 用 于 分 类 ”的 OOB Cout-of-bag) 数据 计算 得 到 OOB 误差 OOB; ; 对 OOB 
得 到 的 各 地 物 类 型 的 分 类 精度 。 其 中 ， 由 于 林地 的 超 像 素 统计 ” 数据 中 所 有 样本 的 变量 随机 加 入 噪声 ， 计 算 OOB 误差 
特征 与 其 他 地 物 差 异性 较 大 ，5 种 分 割 尺 度 对 林地 的 提取 精度 。 “008,;， 则 变量 的 重要 性 计算 P5 采 用 公式 : 
基 


本 一 致 。 分 割 尺 度 对 水 体 、 耕 地 、 建 设 用 地 和 裸 地 的 影响 较 Y oos, - 0B, 
X. K-50000 的 分 制 尺度 对 水 体 、 耕 地 、 建 设 用 地 和 裸 地 的 提 人 oa E 
取 精 度 较 高 。5 种 分 割 尺度 对 水 体 、 耕 地 、 林 地 、 建 设 用 地 和 裸 Importancep 越 大 , 说 明 变 量 F 的 重要 程度 越 大 , 在 分 类 中 
地 的 平均 提取 精度 分 别 是 84.3496, 87.0196, 89.2596, 85.4796, 起 较为 关键 的 作用 .图 11 为 由 超 像素 提取 的 42 个 统计 特征 (分 
89.2396. 割 尺度 为 K=50000) 和 基于 GLCM 提取 的 56 个 纹理 特征 的 变 
量 重要 性 排序 。 这 里 仅 取 前 30 位 进行 展示 , 在 重要 性 排名 前 30 
1w - 个 特征 变量 中 , 有 24 个 为 基于 超 像素 提取 的 统计 特征 , 而 基于 


—— -sooo GLCM 的 纹理 特征 仅 为 6 个 。 排 名 前 3 位 均 为 基于 GLCM 的 


均值 特征 , 说 明 该 特征 的 重要 程度 较 大 。 虽然 基于 GLCM 的 均 
值 特征 排名 靠 前 , 但 是 基于 GLCM 的 其 他 纹理 特征 重要 性 排名 


都 处 于 较 后 位 置 ， 重 要 性 远 不 及 基于 超 像素 提取 的 统计 特征 ， 
对 图 像 中 不 同 地 物 的 区 分 度 不 如 超 像素 统计 特征 ， 因 此 本 文 提 
" 出 的 分 类 方法 能 提高 分 类 精度 ， 分 类 效果 比 仅 使 用 多 光谱 特征 
和 纹理 特征 的 分 类 方法 优良 。 


地 物 的 分 类 精度 〈%) 


75 
水 体 耕地 林地 建设 用 地 gun 
地 物 类 型 
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图 10 不 同 分 割 尺度 下 地 物 的 分 类 精度 


针对 Landsat-8 多 光谱 遥感 图 像 提出 一 种 基于 超 像 素 统计 

表 2 为 仅 使 用 多 光谱 特征 和 纹理 特征 以 及 辅 以 超 像素 统计 EA RF 分 类 方法 。 本 文 对 SLIC 超 像 素 分 割 方法 进行 扩展 和 改 
特征 分割 尺度 K-50000) 的 RF 分 类 精度 比较 。 与 仅 使 用 多  ” 进 ， 使 之 适用 于 多 光谱 遥感 图 像 中 超 像素 的 生成 。 根 据 统计 学 
光谱 特征 和 纹理 特征 的 RF 算法 相 比 ， 辅 以 超 像素 统计 特征 的 ”的 知识 ， 对 超 像素 提取 6 个 统计 量 作 为 分 类 特征 ， 充 分 利用 了 


5 5S 


RF 算法 将 总 体 分 类 精度 提高 约 5.2%，Kappa 系数 提高 7%。 像素 间 的 空间 分 布 关系 ， 有 效 提高 特征 辨识 度 。 本 文 方法 能 
表 2 分 类 精度 比较 效 提高 算法 的 总 体 分 类 精度 和 Kappa 系数 ， 明 显 改 善 分 类 过 程 
总 体 分 类 Kappa 中 对 地 物 的 错 分 和 漏 分 现象 ， 取 得 理想 的 分 类 结果 。 此 外 ， 变 
人 NE co xk 量 重要 性 分 析 也 充分 表明 超 像素 统计 特征 对 分 类 精度 的 提高 起 
1 — 仅 使 用 多 光谱 特征 和 纹理 特征 83.77 0.79 到 了 重要 的 作用 。 


2 辅 以 超 像 素 统计 特征 (K=50000) 89.01 0.86 


波段 4GLCM 均 慎 


de 3 对 仅 使 用 多 光谱 特征 和 纹理 特征 的 RF 算法 和 辅 以 超 
像素 统计 特征 〈 分 割 尺 度 为 K=50000) 的 RF 算法 的 分 类 结果 
建立 混淆 矩阵 后 的 精度 评价 。 由 表 可 知 ， 辅 以 超 像 素 统计 特征 
的 RF 算法 对 水 体 、 耕 地 、 林 地 、 建 设 用 地 和 裸 地 这 5 类 地 物 
的 分 类 精度 与 仅 使 用 多 光谱 特征 和 纹理 特征 的 RF 算法 相 比 ， 
分 别 高 约 5.94%，3.91%，1.55%，7.35%，8.28%。 仅 使 用 多 光 
谱 特征 和 纹理 特征 的 RF 算法 对 水 体 、 裸 地 和 建设 用 地 的 提取 
精度 较 低 。 其 中 , 由 于 建设 用 地 和 裸 地 可 能 存在 光谱 混淆 现象 ， 
造成 两 类 地 物 一 定 程度 的 混 分 。 而 辅 以 K=50000 分 割 的 超 像素 
统计 特征 ， 建 设 用 地 和 裸 地 的 错 分 率 明显 降低 ， 主 要 是 由 于 超 MIL 
像素 统计 特征 能 更 大 程度 的 将 两 类 地 物 区 分 开 ; 水 体 、 林 地 和 Rt 
耕地 的 错 分 和 漏 分 现象 也 得 到 一 定 程度 的 改善 。 超 像素 统计 特 
征 的 加 入 对 林地 的 提取 精度 提高 不 大 。 

3.3 变量 重要 性 分 析 
特征 变量 重要 性 指 特征 变量 对 分 类 精度 产生 影响 的 程度 。 
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表 3 分 类 精度 评价 
验证 样本 个 数 ”分 类 正确 样本 数 分 类 精度 错 分 率 漏 分 率 
类 型 ( 像 元 ) 〈 像 元 ) (96) (95) (96) 
1 2 1 2 1 2 1 2 
水 体 286 229 246 80.07 86.01 498 2.77 19.93 13.99 
耕地 562 482 504 85.77 89.68 17.75 12.8 1423 10.32 
林地 519 457 465 88.05 896 379 0.85 1195 10.4 
建设 用 地 680 552 602 81.18 88.53 20.69 13.88 18.82 11.47 
裸 地 338 278 306 82.25 90.53 2817 20.73 17375 9.47 
总 计 2385 1998 2123 8377 89.01 - 


注 : 表 中 编号 1 为 仅 使 
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